<!DOCTYPE html>
<html lang="en">
<head>
	<meta charset="UTF-8">
	<meta http-equiv="X-UA-Compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
	<title>取回阶段 | Elasticsearch: 权威指南 | Elastic</title>
    <!-- Give IE8 a fighting chance -->
    <!--[if lt IE 9]>
    <script src="https://oss.maxcdn.com/html5shiv/3.7.2/html5shiv.min.js"></script>
    <script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
    <![endif]-->
	<link rel="stylesheet" type="text/css" href="../static/styles.css" />
</head>
<body>
<div class="main-container">
    <section id="content">
        
        <div class="content-wrapper">
            <section id="guide" lang="zh_cn">
                <div class="container">
                    <div class="row">
                        <div class="col-xs-12 col-sm-8 col-md-8 guide-section">
                            <div style="color:gray; word-break: break-all; font-size:12px;">原文地址: <a href="https://www.elastic.co/guide/cn/elasticsearch/guide/current/_fetch_phase.html" rel="nofollow">https://www.elastic.co/guide/cn/elasticsearch/guide/current/_fetch_phase.html</a>, 版权归 www.elastic.co 所有<br/>
                            英文版地址: <a href="https://www.elastic.co/guide/en/elasticsearch/guide/current/_fetch_phase.html" rel="nofollow">https://www.elastic.co/guide/en/elasticsearch/guide/current/_fetch_phase.html</a>
                            </div>
                        <!-- start body -->
                  <div class="page_header">
<b>请注意:</b><br>本书基于 Elasticsearch 2.x 版本，有些内容可能已经过时。
</div>
<div id="content">
<div class="breadcrumbs">
<span class="breadcrumb-link"><a href="index.html">Elasticsearch: 权威指南</a></span>
»
<span class="breadcrumb-link"><a href="getting-started.html">基础入门</a></span>
»
<span class="breadcrumb-link"><a href="distributed-search.html">执行分布式检索</a></span>
»
<span class="breadcrumb-node">取回阶段</span>
</div>
<div class="navheader">
<span class="prev">
<a href="_query_phase.html">« 查询阶段</a>
</span>
<span class="next">
<a href="_search_options.html">搜索选项 »</a>
</span>
</div>
<div class="section">
<div class="titlepage"><div><div>
<h2 class="title">
<a id="_fetch_phase"></a>取回阶段<a class="edit_me edit_me_private" rel="nofollow" title="Editing on GitHub is available to Elastic" href="https://github.com/elasticsearch-cn/elasticsearch-definitive-guide/edit/cn/060_Distributed_Search/10_Fetch_phase.asciidoc">edit</a>
</h2>
</div></div></div>
<p>查询阶段标识哪些文档满足搜索请求，但是我们仍然需要取回这些文档。这是取回阶段的任务, 正如 <a class="xref" href="_fetch_phase.html#img-distrib-fetch" title="分布式搜索的取回阶段">Figure 15, “分布式搜索的取回阶段”</a> 所展示的。</p>
<div id="img-distrib-fetch" class="imageblock">
<div class="content">
<img src="../images/elas_0902.png" alt="分布式搜索的取回阶段">
</div>
<div class="title">Figure 15. 分布式搜索的取回阶段</div>
</div>
<p>分布式阶段由以下步骤构成：</p>
<div class="olist orderedlist">
<ol class="orderedlist">
<li class="listitem">
协调节点辨别出哪些文档需要被取回并向相关的分片提交多个 <code class="literal">GET</code> 请求。
</li>
<li class="listitem">
每个分片加载并 <em>丰富</em> 文档，如果有需要的话，接着返回文档给协调节点。
</li>
<li class="listitem">
一旦所有的文档都被取回了，协调节点返回结果给客户端。
</li>
</ol>
</div>
<p>协调节点首先决定哪些文档 <em>确实</em> 需要被取回。例如，如果我们的查询指定了 <code class="literal">{ "from": 90, "size": 10 }</code> ，最初的90个结果会被丢弃，只有从第91个开始的10个结果需要被取回。这些文档可能来自和最初搜索请求有关的一个、多个甚至全部分片。</p>
<p>协调节点给持有相关文档的每个分片创建一个 <a class="xref" href="distrib-multi-doc.html" title="多文档模式">multi-get request</a> ，并发送请求给同样处理查询阶段的分片副本。</p>
<p>分片加载文档体-- <code class="literal">_source</code> 字段—​如果有需要，用元数据和 <a class="xref" href="highlighting-intro.html" title="高亮搜索">search snippet highlighting</a> 丰富结果文档。
一旦协调节点接收到所有的结果文档，它就组装这些结果为单个响应返回给客户端。</p>
<div class="sidebar">
<div class="titlepage"><div><div>
<p class="title"><strong>深分页（Deep Pagination）</strong></p>
</div></div></div>
<p>先查后取的过程支持用 <code class="literal">from</code> 和 <code class="literal">size</code> 参数分页，但是这是 <em>有限制的</em> 。 要记住需要传递信息给协调节点的每个分片必须先创建一个 <code class="literal">from + size</code> 长度的队列，协调节点需要根据 <code class="literal">number_of_shards * (from + size)</code> 排序文档，来找到被包含在 <code class="literal">size</code> 里的文档。</p>
<p>取决于你的文档的大小，分片的数量和你使用的硬件，给 10,000 到 50,000 的结果文档深分页（ 1,000 到 5,000 页）是完全可行的。但是使用足够大的 <code class="literal">from</code> 值，排序过程可能会变得非常沉重，使用大量的CPU、内存和带宽。因为这个原因，我们强烈建议你不要使用深分页。</p>
<p>实际上， “深分页” 很少符合人的行为。当2到3页过去以后，人会停止翻页，并且改变搜索标准。会不知疲倦地一页一页的获取网页直到你的服务崩溃的罪魁祸首一般是机器人或者web spider。</p>
<p>如果你 <em>确实</em> 需要从你的集群取回大量的文档，你可以通过用 <code class="literal">scroll</code> 查询禁用排序使这个取回行为更有效率，我们会在 <a class="xref" href="scroll.html" title="游标查询 Scroll">later in this chapter</a> 进行讨论。</p>
</div>
</div>
<div class="navfooter">
<span class="prev">
<a href="_query_phase.html">« 查询阶段</a>
</span>
<span class="next">
<a href="_search_options.html">搜索选项 »</a>
</span>
</div>
</div>

                  <!-- end body -->
                        </div>
                        <div class="col-xs-12 col-sm-4 col-md-4" id="right_col">
                        
                        </div>
                    </div>
                </div>
            </section>
        </div>
    </section>
</div>
<script src="../static/cn.js"></script>
</body>
</html>